Analyse-Lifecycle heterogener Informationen auf Basis von Hadoop und Visual Analytics
نویسندگان
چکیده
Gaining an insight on the company’s mass of data was a common goal in the last few years. But information is growing exponentially and companies yearn for a data management system that is able to work with heterogenic data from different sources. A possible answer is the Hadoop Data Platform. With its diverse components, it makes several ways of data management as a foundation for the analysis. The possibilities of Hadoop range from parallelized SQL-Queries to machine learning algorithms. Combined with a visual analytics tool you can gain a deep insight in your own data. This article illustrates an analysis lifecycle of the visual analytics tool Qlik with a connected Hadoop system using the example of European air quality data. Zusammenfassung Einblicke in die großen Datenmengen des Unternehmens zu erlangen, wird in den letzten Jahren immer häufiger fokussiert. Die Datenmengen wachsen exponentiell und sind zudem meist in ihrer Struktur heterogen. Eine Datenverwaltung, die mit heterogenen Informationen aus unterschiedlichen Quellen arbeiten kann, ist daher wünschenswert. Ein mögliches Datenmanagementsystem ist die Hadoop-Plattform. Die vielfältigen Komponenten von Hadoop ermöglichen verschiedene Arten des Datenmanagements als Grundlage für die Analyse. Von parallelisierten SQL-Abfragen bis Machine Learning Algorithmen spannen sich die Möglich-
منابع مشابه
InFuse - Eine datenbankbasierte Plattform für die Informationsfusion
Zusammenfassung Informationsfusion als Prozess der Integration und Interpretation heterogener Daten mit dem Ziel der Gewinnung neuer Informationen einer höheren Qualität eröffnet eine Vielzahl von Anwendungsgebieten. Gleichzeitig erfordert dieser Prozess aber auch eine enge Verzahnung der bislang häufig noch isoliert vorliegenden Werkzeuge und Techniken zum Zugriff auf heterogene Datenquellen, ...
متن کاملProdukt-Mining im Web 2.0
Um im gestiegenen Qualitätsund Kostenwettbewerb zu bestehen, setzen viele Unternehmen verstärkt auf Problemlösungen, die auf die Bedürfnisse der Kunden zugeschnitten sind. Dies setzt jedoch die Kenntnis der Kundenwünsche voraus. Das Web 2.0 stellt eine reichhaltige Quelle an Informationen über Produktbewertungen von Kunden dar. Eine manuelle Analyse ist jedoch sehr aufwändig und nur in geringem...
متن کاملInformationsanbieterzentrierte Spezifikation und Generierung von Informationssystem-Apps
Zusammenfassung Mobilgeräte wie z.B. Smartphones werden heutzutage nicht mehr ausschließlich zur Sprachkommunkation eingesetzt. Sie ermöglichen es, zeitnah Informationen an mobile Nutzer zu übertragen. Hierbei spielt der Aufenthaltsort der Nutzer weitestgehend keine Rolle, er/sie ist quasi jederzeit und allerorts erreichbar. Im Gegensatz zu der Einfachheit der Informationskonsumtion ist das Ent...
متن کاملVorwort: Enterprise Document Management und Information Lifecycle Management
Zu den Herausforderungen der Fachbereiche und IT-Abteilungen moderner Organisationen zählen sowohl das effektive und effiziente Management schwach strukturierter ("weicher") Informationen, insbesondere in Form von Dokumenten, als auch die Auflösung von Medienbrüchen in Geschäftsund Unterstützungsprozessen; beides stellt eine wichtige Voraussetzung für die weitere Steigerung der organisationalen...
متن کاملSemantische Analyse zur Unterstützung von SOA-Governance
Im Hinblick auf sich verändernde Marktbedingungen und die damit verbundenen Flexibilitätsanforderungen ist die effiziente Steuerung und Kontrolle von IT-Systemen auf Basis Service-orientierter Architekturen (SOA) primäres Ziel von SOA-Governance-Frameworks. Die Einführung und Anwendung, d.h., die Bewertung von Prozessen hinsichtlich best-practice-Frameworks, ist in der Regel aufwändig und resso...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2016